Phân tích protein là gì? Các nghiên cứu khoa học liên quan

Phân tích protein (proteomics) là lĩnh vực khoa học nghiên cứu toàn diện thành phần, cấu trúc, chức năng và tương tác của protein trong tế bào hoặc mô để hiểu cơ chế sinh học ở mức phân tử. Proteomics bao gồm định danh và định lượng protein, đặc trưng hóa sửa đổi hậu dịch mã và xây dựng mạng lưới tương tác, ứng dụng trong khám phá sinh vật chỉ điểm, mục tiêu thuốc và vaccine.

Tổng quan về phân tích protein

Phân tích protein (proteomics) là lĩnh vực khoa học chuyên sâu nghiên cứu toàn diện cấu trúc, chức năng, tương tác và định lượng protein trong tế bào, mô hoặc sinh vật. Khác với genoma học chỉ tập trung vào thành phần di truyền, proteomics nghiên cứu sản phẩm thực sự của gen là protein, đồng thời đánh giá các biến đổi hậu dịch mã và sửa đổi hóa học sau dịch mã (PTMs) ảnh hưởng đến hoạt tính sinh học.

Mục tiêu của proteomics bao gồm: (1) định danh tất cả protein có mặt trong một mẫu; (2) định lượng thay đổi biểu hiện protein dưới các điều kiện sinh lý hoặc bệnh lý khác nhau; (3) đặc trưng hóa sửa đổi hóa học như phosphoryl hóa, glycosyl hóa; (4) xây dựng mạng lưới tương tác protein–protein để hiểu đường dẫn tín hiệu và cơ chế bào tương.

Ứng dụng chính của proteomics bao gồm phát hiện sinh vật chỉ điểm (biomarker) cho chẩn đoán bệnh, khám phá mục tiêu thuốc (drug target), và đánh giá hiệu quả điều trị. Với công nghệ khối phổ (MS) hiện đại, proteomics đã đóng góp quan trọng trong nghiên cứu ung thư, bệnh tim mạch, thần kinh học và đáp ứng miễn dịch.

Cấu trúc và chức năng của protein

Protein có bốn cấp độ cấu trúc cơ bản. Cấp độ sơ cấp (primary) là chuỗi amino acid liên kết bằng liên kết peptid; cấp độ thứ cấp (secondary) hình thành cấu trúc α-helix và β-sheet nhờ liên kết hydro giữa nhóm NH và C=O trên mạch chính.

Cấp độ thứ ba (tertiary) mô tả cách chuỗi polypeptide gấp nếp không gian, tạo thành cấu trúc ba chiều duy trì hoạt tính enzyme và khả năng tương tác; cấp độ bốn (quaternary) là tổ hợp nhiều tiểu đơn vị polypeptide để hình thành phức hợp chức năng, ví dụ hemoglobin gồm bốn chuỗi globin.

  • Primary: chuỗi amino acid
  • Secondary: α-helix, β-sheet
  • Tertiary: cấu trúc ba chiều
  • Quaternary: phức hợp đa tiểu đơn vị

Chức năng protein phụ thuộc vào cấu trúc không gian và PTMs. Ví dụ, phosphoryl hóa trên tyrosine hoặc serine/threonine có thể bật/tắt hoạt tính kinase; glycosyl hóa ảnh hưởng đến độ bền và phân bố màng tế bào.

Phương pháp tách và phân tách protein

Trước khi phân tích khối phổ, protein thường được tách khỏi mẫu sinh học và phân tách theo các đặc trưng vật lý – hóa học. Điện di hai chiều (2D-PAGE) là kỹ thuật truyền thống, tách protein theo điểm đẳng điện (pI) trong chiều một và kích thước phân tử trong chiều hai, cho phép phân biệt hàng nghìn protein trên gel.

Sắc ký lỏng (LC) và sắc ký thấm gel (size-exclusion), sắc ký trao đổi ion (ion-exchange), sắc ký gắn affinity (affinity chromatography) cũng được ứng dụng để phân tách trước khi khối phổ. Western blot sử dụng kháng thể đặc hiệu để định danh protein mục tiêu, cung cấp thông tin định tính.

  1. 2D-PAGE: tách theo pI và khối lượng phân tử.
  2. Chromatography: thấm gel, trao đổi ion, affinity.
  3. Western blot: định danh bằng kháng thể.
Phương pháp Đặc tính Ứng dụng
2D-PAGE Phân tách kép Khảo sát mẫu phức tạp
LC-MS/MS Độ nhạy cao Định danh, định lượng
Affinity chromatography Chọn lọc cao Tách protein đặc hiệu

Kỹ thuật khối phổ (Mass Spectrometry)

Mass spectrometry (MS) là phương pháp trung tâm trong proteomics, đo tỷ lệ khối lượng trên điện tích (m/z) của peptide. Quy trình bao gồm: cắt protein thành peptide bằng trypsin; ion hóa (ESI hoặc MALDI); phân tích m/z trên máy MS/MS để phân tích trình tự peptide và đặc trưng PTMs.

Trong MS/MS, phổ m/z của ion gốc được tách tiếp thành mảnh fragment, cho phép suy luận trình tự amino acid. Thư viện dữ liệu peptide và phần mềm như Mascot, MaxQuant hỗ trợ đối chiếu phổ thực nghiệm với cơ sở dữ liệu, định danh protein nhanh chóng.

I(m/z)abundance of peptide ionsI(m/z) \propto \text{abundance of peptide ions}

Độ phân giải và độ chính xác khối lượng cao (>50,000 resolución) giúp phân biệt peptide có khối lượng rất sát nhau, tạo điều kiện phát hiện biến thể vi mô và sửa đổi sau dịch mã.

Phân tích định lượng protein

Phân tích định lượng protein là bước then chốt trong proteomics nhằm so sánh mức biểu hiện hoặc sửa đổi sau dịch mã của protein giữa các điều kiện sinh lý, bệnh lý hay xử lý thuốc khác nhau. Có hai hướng chính:

  • Label-free quantification: dựa trên cường độ tín hiệu peptide (peak intensity) hoặc số lượng phổ (spectral count) trong dữ liệu MS/MS. Phương pháp này không cần gắn nhãn mẫu, phù hợp cho phân tích nhiều mẫu nhưng yêu cầu chuẩn hóa chặt chẽ để giảm nhiễu biến đổi kỹ thuật.
  • Stable isotope labeling: sử dụng đồng vị nặng để đánh dấu peptide, ví dụ SILAC (Stable Isotope Labeling by Amino acids in Cell culture) hoặc TMT (Tandem Mass Tag). Mẫu được trộn lẫn sau giai đoạn gắn nhãn, phân tích chung, cho kết quả định lượng tương đối chính xác và so sánh đồng thời nhiều điều kiện.
Phương pháp Ưu điểm Nhược điểm
Label-free Không cần nhãn, chi phí thấp, linh hoạt Ảnh hưởng nhiễu kỹ thuật, cần chuẩn hóa
SILAC Định lượng chính xác, ít sai số mẫu Chỉ áp dụng cho tế bào nuôi cấy, chi phí cao
TMT So sánh nhiều mẫu (6–16) cùng lúc Chi phí kit cao, tỷ lệ gắn nhãn không hoàn toàn

Sinh học mạng tương tác protein (Protein–Protein Interaction)

Protein–protein interaction (PPI) mapping là công cụ quan trọng để hiểu cách protein hợp thành phức hợp và điều phối đường dẫn tín hiệu. Các phương pháp phổ biến bao gồm:

  1. Yeast two-hybrid: hệ thống tương tác dựa trên phục hồi chức năng của yếu tố phiên mã trong nấm men, định danh cặp protein tương tác nhanh chóng ở quy mô gen.
  2. Co-immunoprecipitation (Co-IP): sử dụng kháng thể đặc hiệu kéo theo phức hợp protein mục tiêu, sau đó phân tách và định danh qua Western blot hoặc MS.
  3. Cross-linking MS: hóa chất cross-linker tạo cầu nối giữa các protein liền kề, sau đó phân tích MS để xác định vị trí liên kết và mô phỏng cấu trúc phức hợp.

Các dữ liệu PPI thường được lưu trữ và khám phá qua cơ sở dữ liệu như STRING (string-db.org) và BioGRID (thebiogrid.org), hỗ trợ xây dựng mạng lưới tương tác và ứng dụng phân tích mạng (network analysis) để tìm nút (hub) quan trọng và mô đun chức năng.

Ứng dụng trong y sinh và dược học

Proteomics đã tạo ra bước đột phá trong y sinh, từ giai đoạn khám phá tới lâm sàng:

  • Biomarker phát hiện sớm: định danh protein khác biệt trong huyết thanh, nước tiểu hoặc dịch lỏng cơ thể cho chẩn đoán ung thư (NCBI PMC), bệnh tim mạch và bệnh lý thần kinh.
  • Drug target discovery: tìm protein mục tiêu điều trị bằng phân tích tương tác thuốc–protein và khảo sát biểu hiện trong mô bệnh lý.
  • Vaccine design: xác định kháng nguyên protein bề mặt vi sinh vật qua proteome, phát triển vaccine tái tổ hợp và peptide (WHO Vaccine R&D).
  • Drug resistance monitoring: phân tích biến đổi protein liên quan kháng thuốc trong ung thư hoặc vi khuẩn, hỗ trợ điều chỉnh phác đồ điều trị.

Thách thức kỹ thuật và dữ liệu

Proteomics phải đối mặt với một số khó khăn chính:

  • Độ động và dải nồng độ protein rộng: protein nội bào có thể dao động từ femtomolar đến millimolar, làm hạn chế khả năng phát hiện protein ít biểu hiện.
  • Phức tạp mẫu sinh học: huyết thanh và mô chứa các protein chiếm ưu thế như albumin hoặc actin, cần bước tiền xử lý để làm giàu protein mục tiêu.
  • Khối lượng dữ liệu lớn: mỗi phép LC-MS/MS tạo ra hàng triệu spectra, đòi hỏi pipeline bioinformatics mạnh như MaxQuant, Proteome Discoverer, cùng thuật toán machine learning để phân tích và lọc false positive.

Việc chuẩn hóa quy trình mẫu, kiểm soát batch effect và sử dụng các bộ chuẩn nội (internal standards) là cần thiết để đảm bảo kết quả reproducible và so sánh giữa phòng thí nghiệm khác nhau.

Xu hướng và công nghệ tương lai

Proteomics đang phát triển hướng tới độ nhạy và độ phân giải cao hơn:

  • Single-cell proteomics: sử dụng nanoLC và ion mobility MS để phân tích protein từ một tế bào đơn, mở ra khả năng khám phá đa dạng biểu hiện trong quần thể tế bào (Nature Biotech.).
  • Top-down proteomics: phân tích protein toàn vẹn thay vì peptide, cho thông tin đầy đủ về isoform và PTMs nhưng đòi hỏi MS độ phân giải cực cao.
  • AI và machine learning: dự đoán cấu trúc protein và tương tác từ dữ liệu proteome, hỗ trợ thiết kế thuốc và phân tích mạng lưới sinh học.
  • Microfluidics và droplet-based MS: tích hợp quy trình xử lý mẫu và ion hóa trong chíp nhỏ, tăng throughput và giảm lượng mẫu cần thiết.

Danh mục tài liệu tham khảo

  • Aebersold R. & Mann M. “Mass-spectrometric exploration of proteome structure and function.” Nature, 537:347–355, 2016.
  • Smith L.M. & Kelleher N.L. “Proteoform: a single term describing protein complexity.” Nat. Methods, 10(3):186–187, 2013.
  • Cox J. & Mann M. “Quantitative, high-resolution proteomics for data-driven systems biology.” Ann. Rev. Biochem., 80:273–299, 2011.
  • Uniprot Consortium. “UniProt: a worldwide hub of protein knowledge.” Nucleic Acids Res., 47(D1):D506–D515, 2019. https://www.uniprot.org
  • Eng J.K. et al. “A deeper look into the data: understanding proteomics databases.” J. Proteome Res., 18(6):2030–2041, 2019.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề phân tích protein:

Chuyển giao điện di của protein từ gel polyacrylamide sang tấm nitrocellulose: Quy trình và một số ứng dụng. Dịch bởi AI
Proceedings of the National Academy of Sciences of the United States of America - Tập 76 Số 9 - Trang 4350-4354 - 1979
Một phương pháp đã được đưa ra để chuyển giao điện di protein từ gel polyacrylamide sang tấm nitrocellulose. Phương pháp này cho phép chuyển giao định lượng protein ribosome từ gel có chứa ure. Đối với gel natri dodecyl sulfate, mô hình ban đầu của dải vẫn giữ nguyên mà không mất độ phân giải, nhưng việc chuyển giao không hoàn toàn định lượng. Phương pháp này cho phép phát hiện protein bằn...... hiện toàn bộ
#chuyển giao điện di #protein ribosome #gel polyacrylamide #nitrocellulose #ure #natri dodecyl sulfate #chụp ảnh phóng xạ tự động #miễn dịch học #kháng thể đặc hiệu #detection #peroxidase #phân tích protein.
Từ điển cấu trúc thứ cấp của protein: Nhận dạng mẫu các đặc điểm liên kết hydro và hình học Dịch bởi AI
Biopolymers - Tập 22 Số 12 - Trang 2577-2637 - 1983
Tóm tắtĐể phân tích thành công mối quan hệ giữa trình tự axit amin và cấu trúc protein, một định nghĩa rõ ràng và có ý nghĩa vật lý về cấu trúc thứ cấp là điều cần thiết. Chúng tôi đã phát triển một bộ tiêu chí đơn giản và có động cơ vật lý cho cấu trúc thứ cấp, lập trình như một quá trình nhận dạng mẫu của các đặc điểm liên kết hydro và hình học trích xuất từ tọa ...... hiện toàn bộ
#cấu trúc thứ cấp protein #liên kết hydro #đặc điểm hình học #phân tích cấu trúc #protein hình cầu #tiên đoán cấu trúc protein #biên soạn protein
Metascape cung cấp nguồn tài nguyên định hướng sinh học cho việc phân tích các tập dữ liệu cấp hệ thống Dịch bởi AI
Nature Communications - Tập 10 Số 1
Tóm tắtMột thành phần quan trọng trong việc diễn giải các nghiên cứu cấp hệ thống là suy diễn các con đường sinh học phong phú và các phức hợp protein có trong các tập dữ liệu OMICs. Việc phân tích thành công yêu cầu tích hợp một bộ dữ liệu sinh học hiện có rộng rãi và áp dụng một quy trình phân tích vững chắc để tạo ra các kết quả có thể diễn giải được. Metascape ...... hiện toàn bộ
#Metascape #phân tích dữ liệu OMICs #con đường sinh học #phức hợp protein #sinh học thực nghiệm
Nghiên cứu và Tầm nhìn của Protein Kinase C Dịch bởi AI
American Association for the Advancement of Science (AAAS) - Tập 233 Số 4761 - Trang 305-312 - 1986
Protein kinase C, một enzyme được kích hoạt bởi quá trình phân giải inositol phospholipid qua trung gian thụ thể, truyền tải thông tin dưới dạng nhiều tín hiệu ngoại bào qua màng để điều chỉnh nhiều quá trình phụ thuộc Ca 2+ . Ở giai đoạn sớm của các phản ứng tế bào, enzyme này dường như có tác động kép, cung cấp cả điều khiển phản ...... hiện toàn bộ
#Protein Kinase C #enzyme #phân giải inositol phospholipid #truyền tải tín hiệu #phản hồi tích cực #phản hồi tiêu cực #giao tiếp tế bào
Ảnh hưởng của đa hình trong vùng promoter của yếu tố hoại tử khối u α ở người lên hoạt động phiên mã Dịch bởi AI
Proceedings of the National Academy of Sciences of the United States of America - Tập 94 Số 7 - Trang 3195-3199 - 1997
Yếu tố hoại tử khối u α (TNFα) là một chất điều hòa miễn dịch mạnh mẽ và là cytokine có tính chất tiền viêm đã được liên kết với sự phát triển của các bệnh tự miễn và nhiễm trùng. Ví dụ, mức độ TNFα trong huyết tương có mối tương quan tích cực với mức độ nghiêm trọng và tỷ lệ tử vong trong bệnh sốt rét và bệnh leishmania. Chúng tôi đã mô tả trước đây một đa hình tại vị trí −308 trong promo...... hiện toàn bộ
#Yếu tố hoại tử khối u α #TNFα #đa hình #phiên mã #bệnh tự miễn #bệnh nhiễm trùng #sốt rét #leishmaniasis #bệnh sốt rét thể não #gen báo cáo #dòng tế bào B #hệ miễn dịch #cytokine #haplotype #phân tích vết chân #protein gắn DNA
Phân tích cấu trúc thứ cấp của protein từ quang phổ phân cực tròn: Phương pháp và cơ sở dữ liệu tham khảo Dịch bởi AI
Biopolymers - Tập 89 Số 5 - Trang 392-400 - 2008
Tóm tắtQuang phổ phân cực tròn (CD) đã là một phương pháp hữu ích cho việc phân tích cấu trúc thứ cấp của protein trong nhiều năm. Với sự ra đời của quang phổ phân cực tròn bức xạ đồng bộ (SRCD) và các cải tiến trong thiết bị cho CD thông thường, dữ liệu tại bước sóng ngắn hơn có thể thu được và nội dung thông tin của quang phổ cũng đã tăng lên. Ngoài ra, các phươn...... hiện toàn bộ
Phân Tích Động Học Của Các Protein Đột Biến Somatic Của Thụ Thể Yếu Tố Tăng Trưởng Biểu Bì Cho Thấy Sự Nhạy Cảm Tăng Cao Đối Với Thuốc Ức Chế Tyrosine Kinase Thụ Thể Yếu Tố Tăng Trưởng Biểu Bì, Erlotinib Dịch bởi AI
Cancer Research - Tập 66 Số 16 - Trang 8163-8171 - 2006
Tóm TắtChúng tôi chỉ ra rằng hai đột biến somatic thường gặp của thụ thể yếu tố tăng trưởng biểu bì (EGFR), L858R và một đột biến thiếu khung Del(746-750), thể hiện đặc tính enzym khác biệt so với EGFR loại hoang dã và có độ nhạy cảm khác nhau đối với erlotinib. Phân tích động học của các miền nội bào tinh chế của EGFR L858R và EGFR Del(746-750) cho thấy cả hai đột...... hiện toàn bộ
HDAC6 điều khiển các con đường phản ứng chính của tế bào đối với sự tích tụ độc hại của các tập hợp protein Dịch bởi AI
Genes and Development - Tập 21 Số 17 - Trang 2172-2181 - 2007
Một cơ chế phòng thủ tế bào chống lại những tác động có hại của việc tích tụ protein bị gập sai bằng cách phát động một phản ứng stress. Deacetylase chất xuất hiện trong tế bào HDAC6 (deacetylase histone 6) trước đây đã được chứng minh là một yếu tố then chốt trong phản ứng này bằng cách phối hợp việc làm sạch các tập hợp protein thông qua việc hình thành aggresome và phân hủy tự thực bào....... hiện toàn bộ
#HDAC6 #ubiquitinated protein aggregates #cell response #chaperones #cytotoxicity
Phân tích độ nhạy cao của kháng thể tự động với thyroglobulin và với peroxidase tuyến giáp Dịch bởi AI
Clinical Chemistry - Tập 35 Số 9 - Trang 1949-1954 - 1989
Tóm tắt Các xét nghiệm có độ nhạy cao này dựa trên sự tương tác giữa kháng thể tự động tại tuyến giáp và 125I-gắn kết kháng nguyên tự động. Các mẫu huyết thanh được ủ với thyroglobulin (Tg) hoặc peroxidase tuyến giáp (TPO) có gắn mác để cho phép hình thành phức hợp kháng thể-kháng nguyên. Các phức hợp sau đó được làm kết tủa bằng cách thêm Protein A ở pha rắn. Tron...... hiện toàn bộ
#kháng thể tự động #thyroglobulin #peroxidase tuyến giáp #xét nghiệm độ nhạy cao #phân tích Scatchard #ái lực #Protein A
Phân tích đặc hiệu cơ chất của phức hợp kinase protein Dbf2-Mob1 qua lựa chọn thư viện peptide và sàng lọc mảng proteome Dịch bởi AI
BMC Biochemistry - Tập 6 Số 1 - 2005
Tóm tắt Đặt bối cảnh Mạng lưới thoát mitotic (MEN) là một nhóm protein tạo thành một chuỗi tín hiệu thiết yếu để các tế bào thoát khỏi quá trình phân bào trong Saccharomyces cerevisiae. MEN cũng đã được liên quan đến vai trò trong phân chia tế bào. Hai thành phần của co...... hiện toàn bộ
#Dbf2-Mob1 #kinase protein #phân chia tế bào #tín hiệu sinh học #cơ chất phosphoryl hóa
Tổng số: 135   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10